让AI帮忙写代码,它每次都要你重新说明代码风格和命名规范。 这些"不可控"的行为,让很多人对 AI 不能完全放手去用,今天,我就来详细聊聊AI Agent Skill 这个让AI变"听话"的工具。 什么是AI Agent Skill? 简单来说,Skill就是AI的能力说明书和工作手册。 它不是复杂的代码,而是结构化的知识文档。 而有Skill的AI,就像一个训练有素的老员工,知道该做什么、怎么做、什么不能做。 为什么需要Skill? AI的三大痛点 痛点1:自作主张 这是最让人头疼的问题。 实战案例解析 写作Agent Skill 以我使用的写作Agent为例,核心架构是: 两层判断机制 先判断工作区(公众号/视频/技术文档等) 再判断任务类型(新写作/修改/审校等) 9步写作流程 从理解需求到最终交付的完整流程 总结 AI Agent Skill不是什么复杂的技术概念,它就是一种让AI更听话、更实用的方法。 通过结构化的规则和流程,Skill解决了AI"不可控"的核心问题。
问题在于:我们一直在用“临时对话”,而没有给AI装上真正的“专业技能”。 本文从“是什么”到“怎么用”,再到“如何写” Agent skill 的角度,把我们从无尽的提示词里解放出来。 关注“AI老马” —【获取资源】&【进群交流】 一、Agent Skill 的通俗解释 通俗的讲: Agent Skill = 给AI打包好的“专业能力模块”。 在 Anthropic 的 Agent 体系里,Skill 是让 AI 从“聊天机器人”变成“专业智能体”的核心。 可以把它理解成,给 AI 安装一个永久生效的插件,把工作流程固化成可调用的技能。 二、Agent Skill 渐进式披露 2.1,skill 的加载过程 渐进式披露是 agent skill 解决有效知识注入的精髓。 四、Skill-未来AI效率的核心组件 Skill 不是一个小功能,它是 AI Agent 时代的基础单元。Anthropic 做 Skill 的本质,是让 AI 从“随机应答”变成“专业执行”。
“你不是在问AI问题——你是在给一个会调AWSCLI、看k8s日志、还能写Terraform的资深SRE下指令。” 它不像传统AI助手那样“只说不练”,而是能直接读取、操作、调试你的真实基础设施。前几天官宣:正式支持AgentSkill。今天我们就拆解Antigravity的Skill能力。 能:查看实时日志执行CLI命令修改IaC配置提出并验证修复方案而Skills(技能)则是它的“专业证书”——告诉AI:“在这个项目里,你该用什么方式做事”。 ---创建一个skill每个技能都需要一个SKILL.md文件,并在文件顶部包含YAML前置元数据:如下是一个代码审查的skill最佳实践保持技能专注性每个技能应专注于做好一件事。 为什么Skill很重要大多数AI编程工具仍停留在“聊天模式”:你需要一遍又一遍地重复解释相同的规则。
,几乎所有的模型接口都是 OpenAI Compatible;但 AI 领域(特别是 Agent 领域)可供探索的空白也还有很多,只要有新的足够好用的规范出现,就会被社区认可。 Skill 就是通过渐进式地添加上下文,教会 AI 掌握一项「技能」,理论上讲,Skill 的最小单位或者说原子化能力,就是「技能」,比如处理 PPT、Excel、PDF 的技能。 (前提是这个外包自己已经具备了相对完善的能力、Skill 和 MCP) 先写这么多,待续: skill的这种做法,可以看做某种 Memory 的管理方式(类似的实现:NevaMind-AI/memU: Memory infrastructure for LLMs and AI agents) 一个 skill 不如 MCP 好用的例子:Notes on SKILL.md vs MCP - Tao of Skill 为什么重要:Why OpenAI’s Move to Skills Matters If You’re Shipping AI Agents Skills Are All You Need
见不到面的关系 抵不过见一面的人 “你不是在问 AI 问题——你是在给一个会调 AWS CLI、看 k8s 日志、还能写 Terraform 的资深 SRE 下指令。” 它不像传统 AI 助手那样“只说不练”,而是能直接读取、操作、调试你的真实基础设施。 前几天谷歌正式官宣:正式支持Agent Skill。 能: 查看实时日志 执行 CLI 命令 修改 IaC 配置 提出并验证修复方案 而 Skills(技能) 则是它的“专业证书”——告诉 AI:“在这个项目里,你该用什么方式做事”。 创建一个skill 每个技能都需要一个 SKILL.md 文件,并在文件顶部包含 YAML 前置元数据: 如下是一个代码审查的skill 最佳实践 保持技能专注性 每个技能应专注于做好一件事。 有了 skill 之后,你再也不用在复制粘贴中虚度人生了,并且也不需要主动增加额外的提示,AI 就可以根据上下文自己判断。当然,如果你想确保使用某个 Skill,也可以直接提它的名字。
以下是一个工具包装器的示例,它教会Agent如何编写 FastAPI 代码。 请注意,指令明确地告诉Agent,只有在开始审查或编写代码时才加载 . 它只是协调这些资源的检索,并强制Agent逐步执行它们: # skills/report-generator/SKILL.md --- name: report-generator description 指令保持不变,但Agent会从外部清单动态加载具体的审查标准,并强制生成结构化的、基于严重性的输出: # skills/code-reviewer/SKILL.md --- name: code-reviewer 关键在于严格的阶段划分和明确的把关提示,这些提示会阻止Agent在收集到所有用户答案之前生成最终计划: # skills/project-planner/SKILL.md --- name: project-planner 在用户确认上一步生成的文档字符串之前,Agent程序被明确禁止进入组装阶段: # skills/doc-pipeline/SKILL.md --- name: doc-pipeline description
Shadow:Skill把Prompt和脚本、Tool整合在一起,想要设计好用的skill,需要深刻理解原理,把适合的任务放入到Prompt、脚本和Tool。 良好架构的Skill,可以提升执行效率和准确性。 这篇论文研究得出:模型自己写的Skill没用。推荐阅读⬇️ 导读:Agent Skills 正在成为 LLM 智能体的标配,但它们真的有效吗? 随着 Claude Code、Gemini CLI 等 agent-centric 工具的爆发,Agent Skills(智能体技能)已成为增强 LLM 代理能力的热门方案。 作为首个将 Skills 作为一级评估对象的基准测试,它通过 7,308 条轨迹的大规模实证评估,揭示了 Agent Skills 效能的真相。 建议:过于详尽的文档会增加 context burden,agent 难以从中提取 actionable guidance。
目录 Skill 简介 Skill 规范详解 trpc-agent-go 中的 Skill 实现 3.1 整体架构 3.2 快速集成指南 3.3 Skill 加载机制详解(核心) 3.4 一次对话中 Skill Skill 简介 1.1 什么是 Skill? 在 LLM Agent 的发展过程中,「Tool(工具)」 是最早被广泛采用的能力扩展方式。 创建 Agent 并启用 Skill agent := llmagent.New( "my-agent", llmagent.WithSkills(repo), // 代码执行:Skill 的典型场景 代码执行是 Skill 最典型的应用场景之一,trpc-agent-go 提供了完善的执行器机制。 框架为实例,深入分析了如何在 Agent 开发中设计和集成 Skill 系统。
二、问题排查:排除常见误区遇到问题后,首先排查了最容易出现问题的两个点,均排除异常:确认Skill已成功打包:检查部署的jar包,解压后确认skill相关文件已正常包含在内,不存在打包遗漏的情况;确认SkillName 排除上述常见问题后,推测可能是框架本身的兼容性问题,于是去GitHub上搜索相关问题,果然发现已有其他开发者遇到过相同情况,并且提交了Issue:https://github.com/alibaba/spring-ai-alibaba 目录,这是目前spring-ai-alibaba框架的一个已知bug。 Skill,对应的查找策略改用FileSystemSkillRegistry。 相关Issue:https://github.com/alibaba/spring-ai-alibaba/issues/4426*/StringskillPath=SpringUtils.getProperty
**Agent Skill 是什么? **Agent Skill 是 Anthropic 于 2025 年确立的**开放式 AI 代理构建标准**,其本质是将复杂的 Prompt 工程、外部知识库(Reference)与执行逻辑(Script 2025 年 12 月 18 日,随着 Agent Skill 被确立为开放标准(Open Standard),它正式标志着 AI 开发进入了**“技能工程(Skill Engineering)”**的新阶段 ---## 七、 总结与展望Agent Skill 标准的普及,标志着 AI 应用开发正在经历从“炼金术”到“土木工程”的转变。 随着 2026 年更多 OS 级(操作系统级)AI 的接入,Agent Skill 有望成为未来人机交互的基础协议之一。### 附录:参考资料与推荐阅读1.
本文聚焦于“Agent自主生成Skill”这一前沿技术路径,深入探讨如何通过大语言模型(LLM)驱动Agent在感知环境后,自主构建、调试并执行自动化技能。 幻觉导致的逻辑死循环:现象:Agent生成的Skill在处理验证码或多级弹窗时,可能会反复尝试无效点击。 对策:优先使用实在Agent内置的AI视觉识别模式,而非依赖DOM树。通过CV技术定位坐标,可有效解决国产化环境下的兼容性难题。 对策:在Agent执行层设置“操作白名单”,限制其仅能在指定的URLor应用范围内生成Skill。 5.2方案总结本文探讨的Agent自主生成Skill方案,本质上是利用大模型的逻辑推理能力替代了传统的人工脚本编写过程。
SKILL随着 AI Coding 和智能体开发越来越普及,越来越多开发者开始把大模型接入真实应用中。 一个很常见的问题也逐渐暴露出来:同类 prompt 在不同场景中反复编写、重复维护,导致能力难以复用,系统也越来越臃肿,以 open_deep_research( https://github.com/langchain-ai 很容易装进 Claude Code / Codex / OpenClaw 之类的 coding agent,但对很多自建 LLM 应用、业务 Agent、对话系统来说,并没有一个低侵入接入层。 为了解决这个问题,我开源了SKILL-adapter的轻量级适配层:不要求重写整套 Agent 框架,也不要求迁移现有后端,只需要在原有模型调用前多接一层 adapter layer,就能获得 Skill → Skill Routing → Skill 选择 → Prompt Augmentation → 现有 LLM 应用的流程,以低侵入的方式直接接入ai应用中from skill_adapter import
本文收录于Github:AI-From-Zero项目——一个从零开始系统学习AI的知识库。如果觉得有帮助,欢迎⭐Star支持!什么是Skills?为什么说Skill是被"理解"而不是被"执行"的? 一、简介Skill是一份写给AI看的"操作说明书",它告诉Agent在什么情况下该做什么事。 操作说明书教你怎么用手的教程github(教Agent怎么用ghCLI)重要区别:有Tool没Skill:Agent有手但不知道怎么干活有Skill没Tool:Agent知道该做什么但没有能力执行这就是为什么安装一个 Skill并不自动赋予Agent新的权限——你还需要确保相应的Tool已经启用。 传统的单元测试无法验证Skill是否会在"正确的时候"被调用,因为这取决于LLM的推理,而推理不是确定性的。这是Skill开发者需要面对的新课题,也是AI编程范式带来的根本性改变。
如果Agent总是犯同样的错误,或处理一类任务时总是要探索很久,用户不得不重复冗长的提示词,那么是时候把它包装成Skill了。 这里无意具体介绍其机制。 Skills已经成为提升Agent能力的一大利器。Claude Code和Codex等工具也已经内置了帮助创建Skill的Skill。 weather-data-skill 大部分天气、气候研究都基于公开数据。寻找、下载、处理天气、气候数据占去了研究人员大量的精力。AI的发展应当为研究人员节省这些时间。 但现实是,受限于数据源、接口和格式的复杂性,AI仍需要精细地指引才能完成这类工作。 尽管我们可以设计更复杂的专用Agent,但其实对该场景,通用Agent+Skills已经足够。 你可以让你的AI来帮你安装,将仓库地址提供给它即可。 展望 随着Agent能力的增强,和Skills的持续火爆,有理由相信我们可以用这种形式解决以下问题: 对于特定场景,有哪些可用的数据集?
Skill(技能) 是什么:这是一个偏产品和应用层的概念。一个 Skill 可以理解为赋予 Agent 的一种特定能力或“插件”。 它旨在解决一个问题:如何让 AI 模型(特别是 Agent)能够以一种统一、安全的方式,动态地发现和使用各种外部工具和数据源。 本质:可以看作是 AI 世界的“USB-C 接口”。 一个 Skill 可以封装多个 Function Call。Skill能力包应用/产品层如何将一组相关功能打包,方便 Agent 调用? Agent 通过拥有 Skill 来获得能力。MCP协议基础设施层如何让 Agent 能通用、安全地发现和连接任何工具?它是“万能接口标准”。 总结 Prompt 是语言,告诉 AI “要什么”。 Function Call 是工具,赋予 AI “怎么做” 的能力接口。 Skill 是技能包,将相关工具打包,让 AI 的能力模块化。
前提 1.1 AI Agent 构成 模型:为智能体的推理和决策提供动力的LLM,决定了智能体的下限。 工具:智能体可用于采取行动的外部函数或API。 指令:定义智能体行为的明确指导方针和安全策略。 三者构成了 AI Agent 的下限和上限,模型越强,对于指令和工具的调度能力更准确,但是从工程学的角度来考虑,较弱的模型通过对工具和指令的结合,一样能制造功能强大的 Agent。 透明性 知识存在于人类可读的 SKILL.md 中,可审计、可理解、可讨论。 复用性 一个 Skill 编写一次,可以在任何兼容的 Agent 框架中加载使用。 6.5 设计哲学:从「训练 AI」到「教育 AI」 知识被提升为一等公民资源。 Skills 机制把领域知识从模型参数中剥离,做了一件事: 过去:要教模型新技能 → 收集数据 + 训练 现在:要教模型新技能 → 写/编辑 SKILL.md 文档 这是一种从「训练 AI」到「教育 AI
❝当 AI Agent 需要的知识越来越多,把一切都塞进 System Prompt 显然不是个好主意。本文从架构设计的角度出发,深入探讨一种优雅的解法——「Skill 渐进式加载机制」。 ❞ 一、问题:当 Agent 需要"十八般武艺" 构建一个功能丰富的 AI Agent 时,我们不可避免地面临这样的困境: 「知识膨胀」:Agent 需要掌握代码审查、数据分析、文档撰写等几十种技能,每种技能的指导文本可能上千 5.1 两类核心 Key Key 模式 含义 典型值 temp:skill:loaded:{agent}/{skill} 标记某 Skill 已被某 Agent 加载 "1" temp:skill:docs :{agent}/{skill} 记录 Agent 对某 Skill 选择的文档 "*" 或 JSON 数组 temp: 前缀表示这些是临时状态,不参与 Session 的持久化归档。 agentName),可以高效地获取某个 Agent 的所有已加载 Skill,而不会误读其他 Agent 的状态。
系统化提升Skill描述的可触发性与可维护性,以及通过cybersecurity-expert将安全审计与威胁分析引入Agent工作流。 Skill1:feiman-coach-费曼学习法的AI实现背景与痛点学习新概念时,我们常常陷入"表面理解"的陷阱:以为自己懂了,但用简单语言解释时却卡壳。 能否用AI实现自动化、零容忍的安全审计? 对安全问题严格评级,不妥协威胁情报关联:关联CWE、CVE等权威标准可操作建议:每个问题都有具体的缓解建议技术亮点总结###多专家协作模式的有效性通过定义虚拟专家角色和清晰的协作流程,实现了:复杂任务分解:单一Agent 这不仅是一次技术探索,更是一次"与AI协同开发AI"的有趣实践。
一、产品定位与核心亮点 技术定义:腾讯云媒体处理MPS Skills是一款AI Agent Skill,通过自然语言对话交互,支持用户完成招生图生视频、去字幕、加数字水印、画质增强、转码压缩等整套媒体处理流程 三、应用框架和功能介绍 · 功能框架 产品架构整合转码、增强、字幕、AI生图/视频等全能力,支持多任务无缝衔接。 核心功能模块包括:视频转码、视频增强、字幕处理、撰除处理、图片处理、AI生图/视频、音频处理及更多丰富AI处理工具。 零门槛创作:集成主流AIGC大模型,一键批量调用,无需自主接入,AI创意表达更简单。 一站式内容处理:整合转码、增强、字幕、AI生图/视频等全能力,多任务无缝衔接。 生图/视频:文生图、图生图、文生视频、图生视频; 音频处理:人声提取、伴奏分离、背景声分离等; 更多丰富AI处理工具:AI解说二创、视频译制(翻译字幕&配音)、智能横转竖&竖转横、电商换装、媒体质检等
背景:技能检索与部署的挑战 在利用 AI Agent(如 Claude Code, Cursor, Trae)进行开发时,开发者面临的核心挑战在于技能(Skill)的 检索效率 与 安装成本: • 发现困难 Vercel Skill 定位于 跨 Agent 的技能包管理器。它通过 find 命令建立标准化的检索机制,通过 add 命令实现自动化部署,将 Agent 的能力扩展过程标准化。 2. Agent (如 Claude Code)源码托管 (GitHub/Local)Vercel Skill CLI (add.ts)用户AI Agent (如 Claude Code)源码托管 (GitHub 总结 Vercel Skill 通过标准化的 CLI 工具,打破了 AI Agent 技能发现与部署的壁垒: 1. 用户侧:提供了类似 npm 的丝滑体验,实现了一次安装、多 Agent 同步。 随着 AI Agent 生态的爆发,这种跨平台、标准化的技能包管理方案将成为提升开发者生产力的关键基础设施。